人工智能的最新进展已经产生了可以在围棋、星际争霸和 Dota2 等游戏中击败人类世界冠军的代理。然而,这些模型中的大多数似乎并没有以类似人类的方式进行游戏:人们从他人的行为中推断出他们的意图,并利用这些推断来策划和制定战略。在这里,我们使用贝叶斯心智理论 (ToM) 方法,研究了在合作游戏中明确表达他人意图对提高表现的程度。我们比较了人类在具有和不具有 ToM 的最佳规划代理的情况下在合作游戏中的表现,玩家必须灵活合作才能实现共同目标。我们发现,在与所有类型的合作伙伴(非 ToM、ToM 以及人类玩家)合作时,拥有 ToM 代理的团队表现明显优于非 ToM 代理,并且 ToM 代理越多,ToM 的好处就越大。这些发现对于设计更好的合作代理具有重要意义。
![arXiv:2007.15703v1 [cs.AI] 2020 年 7 月 30 日PDF文件第1页](/bimg/d/d5cdd6f5bc97eba78783b2c42d6ead351382e641.webp)
![arXiv:2007.15703v1 [cs.AI] 2020 年 7 月 30 日PDF文件第2页](/bimg/7/7eca51b292ebb67cd722543d1bef90e4fdc0c914.webp)
![arXiv:2007.15703v1 [cs.AI] 2020 年 7 月 30 日PDF文件第3页](/bimg/2/2bac3d898cddf21edc79c03e64674686abf34e1a.webp)
![arXiv:2007.15703v1 [cs.AI] 2020 年 7 月 30 日PDF文件第4页](/bimg/6/6f7818fc8224ec15b1ed78052bd8c9bd413ba5b9.webp)
![arXiv:2007.15703v1 [cs.AI] 2020 年 7 月 30 日PDF文件第5页](/bimg/6/6c0f7b46fdf8778b72cbef3bd9f04786a43db9a1.webp)
